Maximumgrad

计算逐元素 Maximum 操作的梯度。该算子是 Maximum 算子的反向传播部分。梯度 dy 将被路由到在前向传播中值较大的那个输入。

\[ \begin{align}\begin{aligned}\begin{split}\text{dx0}_i = \begin{cases} \text{dy}_i, & \text{if } \text{Input0}_i > \text{Input1}_i \\ 0, & \text{otherwise} \end{cases}\end{split}\\\begin{split}\text{dx1}_i = \begin{cases} \text{dy}_i, & \text{if } \text{Input1}_i \ge \text{Input0}_i \\ 0, & \text{otherwise} \end{cases}\end{split}\end{aligned}\end{align} \]
输入:
  • Input0 - 前向传播时的第一个输入数据地址。

  • Input1 - 前向传播时的第二个输入数据地址。

  • dy - 后续层反向传播回来的梯度数据地址。

  • Input0_dims - Input0 的维度信息数组。

  • Input1_dims - Input1 的维度信息数组。

  • num_dims - 输入张量的维度数量。

  • core_mask - 核掩码(仅共享存储版本需要)。

输出:
  • dx0 - 计算出的关于 Input0 的梯度地址。

  • dx1 - 计算出的关于 Input1 的梯度地址。

支持平台:

FT78NE MT7004

备注

  • FT78NE 支持fp32

  • MT7004 支持fp16, fp32

共享存储版本:

void hp_maximumgrad_s(half *Input0, half *Input1, half *dy, int *Input0_dims, int *Input1_dims, int num_dims, half *dx0, half *dx1, int core_mask)
void fp_maximumgrad_s(float *Input0, float *Input1, float *dy, int *Input0_dims, int *Input1_dims, int num_dims, float *dx0, float *dx1, int core_mask)

C调用示例:

 1//FT78NE示例
 2#include <stdio.h>
 3#include <maximumgrad.h> // 假设头文件名为 maximumgrad.h
 4
 5int main(int argc, char* argv[]) {
 6    // 假设在DDR空间,且形状相同
 7    float *input0 = (float *)0xA0000000;
 8    float *input1 = (float *)0xA1000000;
 9    float *dy = (float *)0xA2000000;
10    float *dx0 = (float *)0xB0000000;
11    float *dx1 = (float *)0xB1000000;
12
13    int dims[] = {4, 256};
14    int num_dims = 2;
15    int core_mask = 0xff;
16
17    fp_maximumgrad_s(input0, input1, dy, dims, dims, num_dims, dx0, dx1, core_mask);
18    return 0;
19}

私有存储版本:

void hp_maximumgrad_p(half *Input0, half *Input1, half *dy, int *Input0_dims, int *Input1_dims, int num_dims, half *dx0, half *dx1)
void fp_maximumgrad_p(float *Input0, float *Input1, float *dy, int *Input0_dims, int *Input1_dims, int num_dims, float *dx0, float *dx1)

C调用示例:

 1//FT78NE示例
 2#include <stdio.h>
 3#include <maximumgrad.h> // 假设头文件名为 maximumgrad.h
 4
 5int main(int argc, char* argv[]) {
 6    // 假设在L2空间,且形状相同
 7    float *input0 = (float *)0x10000000;
 8    float *input1 = (float *)0x11000000;
 9    float *dy = (float *)0x12000000;
10    float *dx0 = (float *)0x13000000;
11    float *dx1 = (float *)0x14000000;
12
13    int dims[] = {4, 256};
14    int num_dims = 2;
15
16    fp_maximumgrad_p(input0, input1, dy, dims, dims, num_dims, dx0, dx1);
17    return 0;
18}